实验发现，电子有一种内禀的角动量，称为自旋角动量，它源于电子的内禀性
质，是一种非定域的性质，一种量级为相对论性的效应，本来，在Dirac相对论性
电子方程中，这个内京角动量很自然地体现作为该方程的旋量结构，但由于
Sehrodinger方程是Dirac方程最低阶非相对论近似，因此Schrodinger方程忽略了
这种旋量结构。换句话说，对于非相对论Schrodinger方程来说，自旋作用表现出
是一种新的额外的自由度，对它的描写只能以外来方式引入，添加在Schrodinger
方程上，到目前为止，非相对论量子力学所拟定的关于它的一套计算方法，使人们
能够毫无困难地从理论上预测实验结果并计算它在各种场合下的运动和变化，但其
实是，整个量子理论对这个内禀角动量（以及伴随的内禀磁矩）的物理本质依然缺
乏透彻的了解

\subsection{电子自旋实验}

早期与发现电子自旋有关的实验有：
\begin{itemize}
    \item 原子光谱的精细结构（比如，氢原子
          $2p\rightarrow 1s$跃迁存在两条彼此很靠近的两条谱线，碱金属原子光谱存在双线结构等）
    \item 1912年反常Zeeman效应，特别是氢原子的偶数重磁场谱线分裂，这些谱线的偶数
          重分裂现象无法用轨道磁矩与外磁场相互作用解释，因为这种解释只能使谱线分裂
          为奇数(2l+1)重：
    \item 1922年Stern-Gerlach实验，实验使用中性顺磁银原子，经高温蒸
          发出射后形成银原子束，通过一个十分不均匀的磁场，束中银原子为中性，不受
          Lorentz力作用，并且经蒸发透出后，银原子永久磁矩的指向必定是随机、各向同性
          的，于是当它们穿过非均匀磁场时，磁矩和磁场方向的夹角是随机的，从而银原子
          束在通过磁场并接收非均匀磁场力的作用之后，在接收屏上应当相对于平衡位置散
          开成一个宽峰，但实验事实是给出了明显对称分开的两个峰，实测分别相应于正负
          Bohr磁子！
\end{itemize}

针对以上难以理解的实验现象，1925年Uhlenbeck和Goudsmit提出假设：电
子在旋转着,表现出称为自旋的内禀角动量$\boldsymbol{S}$.为了与实验表现相符,
他们认为,这个内禀角动量对任意方向的取值都只有$\pm \frac{\hbar}{2}$两个数值,
并且伴随自旋存在一个内禀磁矩$\boldsymbol{\mu}$,两者关系为

\begin{equation*}
    \mu=-\frac{e}{m c} S
\end{equation*}
电子自旋的回磁比是轨道回磁比的两倍.由此,电子便有了$m, e, S, \mu$共四个体现内禀性质的物理量.
根据实验事实,以外加的方式引入电子自旋这一内禀自由度之后,不仅原子的磁性性质,
而且原子光谱本身的一些精细结构,以及在外场下的多重分裂现象,都得到了很好的解释.

然而,认为电子自旋角动量来源于电子旋转这一经典图像却立即遭到否定.
假设电子半径为$r_{\mathrm{e}}$,作为定性估算可以合理地假定

\begin{equation*}
    \begin{gathered}
        \frac{e^2}{r_{\mathrm{e}}} \sim m c^2, \quad r_{\mathrm{e}} p \sim \hbar \\
        v=\frac{p}{m} \approx \frac{\hbar}{m r_{\mathrm{e}}} \approx\left(\frac{\hbar c}{e^2}\right) c=137c
    \end{gathered}
\end{equation*}


这就是说,为了要在$r_{\mathrm{e}}$的半径下旋转得出$\hbar$的角动量,电子必须大致以一百余倍的光速转动才行.
显然,这是一个不能接受的图像,说明电子自旋角动量有着另外更深刻的内禀原因.
\subsection{电子自旋态的表示}

由于电子自旋是一个新自由度,并且相应于这个新自由度的新变数$s_z$只能取两个值$\pm \frac{\hbar}{2}$,
于是电子状态波函数是一个两分量的列旋量(注意不是两分量的列矢量,两者在空间转动下的表现不同.)

\begin{equation*}
    \psi\left(\boldsymbol{r}, s_z, t\right)=\binom{\psi_1(\boldsymbol{r}, t)}{\psi_2(\boldsymbol{r}, t)}=\psi_1(\boldsymbol{r}, t)|\alpha\rangle+\psi_2(\boldsymbol{r}, t)|\beta\rangle
\end{equation*}

这里$|\alpha\rangle=\binom{1}{0},|\beta\rangle=\binom{0}{1}$分别代表自旋角动量第三分量$s_z$取朝上
$\frac{\hbar}{2}$和朝下$-\frac{\hbar}{2}$的状态.于是

\begin{equation*}
    \begin{aligned}
         & \int\left|\psi_1\right|^2\mathrm{~d} r=\text {自旋朝上的概率} \\
         & \int\left|\psi_2\right|^2\mathrm{~d} r=\text {自旋朝下的概率}
    \end{aligned}
\end{equation*}

总的归一化表示为
\begin{equation*}
    \int \psi^{+} \psi \mathrm{d} r=\int \mathrm{d} r\left(\left|\psi_1\right|^2+\left|\psi_2\right|^2\right)=1
\end{equation*}

如果体系Hamilton量$H$中不含自旋角动量,或是自旋部分和空间部分可以分开
(即$H=H_0+H_{\mathrm{s}}$),则自旋波函数和空间波函数就可以分离,

\begin{equation*}
    \left\{\begin{array}{l}
        \psi\left(\boldsymbol{r}, s_z, t\right)=\varphi(\boldsymbol{r}, t) \chi\left(s_z, t\right) \\
        \chi\left(s_z, t\right)=\binom{\chi_1(t)}{\chi_2(t)}=\chi_1(t)|\alpha\rangle+\chi_2(t)|\beta\rangle
    \end{array}\right.
\end{equation*}


考虑电子自旋角动量之后, Schrödinger方程便由单分量的方程扩充为两分量的方程,后者常称为Pauli方程.

以上叙述再次阐明,微观粒子(在所处状态下)自旋波函数的物理意义是:
实验前,自旋波函数描述了微观粒子自旋取值的潜在能力;实验中,自旋波函数预期了由潜在能力转成的实验表现.
注意,中性银原子射线束,在进入S-G实验装置之前的空间飞行中,各个银原子的自旋指向应当杂乱而各向同性.
只当进入装置后,全体各自朝磁场方向都选取了正或反两个方向!
正是依照这个实验事实,人们认定,不论电子处于什么自旋状态,其自旋朝任何方向的取向都只是正向或逆向两种.
因此,自旋波函数的这个奇特性质在观念上是源自实验的!

\subsection{自旋算符与Pauli矩阵}

自旋既是角动量就应当满足角动量的对易规则,

\begin{equation*}
    \left[S_i, S_j\right]=\mathrm{i} \hbar \varepsilon_{i j k} S_k \quad(i=x, y, z)
\end{equation*}


由于自旋波函数是两分量的列旋量,因而自旋角动量的三个分量算符$S_i$自然就是三个$2\times2$的Hermite矩阵,
以便对这些两分量列旋量的自旋态进行映射(或称变换).于是引入三个二阶Hermite矩阵$\sigma_i$来表示$S_i$,令

\begin{equation*}
    S_i=\frac{\hbar}{2} \sigma_i \quad(i=x, y, z)
\end{equation*}


这里已经抽出$S_i$的绝对数值$\frac{\hbar}{2}$,所以$\sigma_i$的本征值只能为$\pm1$,
就是说$\sigma_i$为自逆矩阵.将$\sigma_i$代入对易规则,就得到决定它们的下列关系:

\begin{equation*}
    \left\{\begin{array}{l}
        {\left[\sigma_i, \sigma_j\right]=2\mathrm{i} \varepsilon_{i j k} \sigma_k} \\
        \sigma_i^2=\sigma_0
    \end{array}\right.
\end{equation*}

$\sigma_0=\left(\begin{array}{ll}1&0\\0&1\end{array}\right)$为二阶单位矩阵.
由$\sigma_i$间的这些对易关系也能导出$\sigma_i$间的反对易关系
\begin{equation*}
    \begin{aligned}
        0 & =\left[\sigma_0, \sigma_j\right]=\left[\sigma_i^2, \sigma_j\right]=\sigma_i\left[\sigma_i, \sigma_j\right]+\left[\sigma_i, \sigma_j\right] \sigma_i \\
          & =2\mathrm{i} \varepsilon_{i j k}\left(\sigma_i \sigma_k+\sigma_k \sigma_i\right)=2\mathrm{i} \varepsilon_{i j k}\left\{\sigma_i, \sigma_k\right\}
    \end{aligned}
\end{equation*}

对任一给定的$j$,总可以取$i, k$,使$i \neq k \neq j$,于是看到, $\sigma_i$之间彼此反对易,

\begin{equation*}
    \left\{\sigma_i, \sigma_k\right\}=0\quad(i \neq k)
\end{equation*}


将它们代入(7.6a)式,得到$\sigma_i$之间另一组关系

\begin{equation*}
    \left\{\begin{array}{l}
        \sigma_i \sigma_j=\mathrm{i} \varepsilon_{i j k} \sigma_k \\
        \left\{\sigma_i, \sigma_j\right\}=2\delta_{i j}
    \end{array}\right.
\end{equation*}
当然, (7.6b)式和(7.6a)式两组关系彼此等价,可以相互推导.总之,这三个$2\times2$的Hermite矩阵$\sigma_i$是自逆、反对易、零迹的.最后一点是由于

\begin{equation*}
    0=\operatorname{tr}\left[\sigma_i, \sigma_j\right]=2\mathrm{i} \varepsilon_{i j k} \operatorname{tr} \sigma_k \rightarrow \operatorname{tr} \sigma_k=0\quad(k=x, y, z)
\end{equation*}
从一般物理要求出发的分析只能到此为止.
但现在仍然不能将这三个Hermite矩阵$\left\{\sigma_i\right\}$的具体形式完全确定下来,
需要进一步附加人为约定.不同附加约定所求得的三个$\left\{\sigma_i\right\}$也将不同.
然而,它们都能满足上面全部要求,物理上是等价的,彼此只相差一个$2\times2$的幺正变换.
于是就出现了需要选择$\left\{\sigma_i\right\}$表象的问题.
下面只给出$\sigma_i$的一个常用表象—Pauli矩阵表象. 这个由Pauli引入的表象有两条附加约定:
首先,约定$\sigma_z$是对角的.再考虑到$\sigma_z$的本征值为$\pm1$,于是就直接写出$\sigma_z$为

\begin{equation*}
    \sigma_z=\left(\begin{array}{cc}
        1 & 0  \\
        0 & -1
    \end{array}\right)
\end{equation*}

进一步,根据$\sigma_x$必须是零迹的Hermite矩阵,
可令$\sigma_x=\left(\begin{array}{cc}a & b \\ b^* & -a\end{array}\right), a, b$
为两个待定的复数.根据$\sigma_z \sigma_x=-\sigma_x \sigma_z$,代入$\sigma_z$和$\sigma_x$的表达式后
可得$a=0$,考虑到$\sigma_x^2=\left(\begin{array}{ll}1&0\\0&1\end{array}\right)$,
又得$b=\mathrm{e}^{\mathrm{i} \alpha}$为任一相因子.
至此仍不能完全决定$\sigma_x$.其次,约定$\sigma_x$中相位$\alpha=0$.于是有

\begin{equation*}
    \sigma_x=\left(\begin{array}{ll}
        0 & 1 \\
        1 & 0
    \end{array}\right)
\end{equation*}

求得$\sigma_y$为

\begin{equation*}
    \sigma_y=-\mathrm{i} \sigma_z \sigma_x=\left(\begin{array}{cc}
            0          & -\mathrm{i} \\
            \mathrm{i} & 0
        \end{array}\right)
\end{equation*}
Pauli作了这两条约定之后,得到下面这组$2\times2$的自逆、反对易、零迹的Hermite矩阵——Pauli矩阵:
\begin{equation*}
    \sigma_x=\left(\begin{array}{ll}
        0 & 1 \\
        1 & 0
    \end{array}\right), \quad \sigma_y=\left(\begin{array}{cc}
        0          & -\mathrm{i} \\
        \mathrm{i} & 0
    \end{array}\right), \quad \sigma_z=\left(\begin{array}{cc}
        1 & 0  \\
        0 & -1
    \end{array}\right)
\end{equation*}
现在可以用这组矩阵具体计算自旋角动量的对易规则,以及对两分量自旋态的映射作用.

简单考察即知,用这三个矩阵再加上$\sigma_0$构成一组完备的矩阵基$\left\{\sigma_i, \sigma_0\right\}$,
可用以分解(展开)任何$2\times2$的复矩阵.应当指明,由于$\sigma_i$本身的自逆性质和$\sigma_i$之间的反对易性质,
类似于通常选用一组正交归一基矢对矢量展开时的归一性质和正交性质。
使用这组矩阵基$\left\{\sigma_i, \sigma_0\right\}$对$2\times2$复矩阵作展开,
并随之而来的乘法运算表明,这种性质对计算最为方便
(伴随相乘而来的各个自乘项矩阵为单位矩阵$\sigma_0$,交叉项之和消失).